首页> 外文OA文献 >Robust and Scalable Column/Row Sampling from Corrupted Big Data
【2h】

Robust and Scalable Column/Row Sampling from Corrupted Big Data

机译:来自损坏的大数据的稳健且可扩展的列/行采样

代理获取
本网站仅为用户提供外文OA文献查询和代理获取服务,本网站没有原文。下单后我们将采用程序或人工为您竭诚获取高质量的原文,但由于OA文献来源多样且变更频繁,仍可能出现获取不到、文献不完整或与标题不符等情况,如果获取不到我们将提供退款服务。请知悉。

摘要

Conventional sampling techniques fall short of drawing descriptive sketchesof the data when the data is grossly corrupted as such corruptions break thelow rank structure required for them to perform satisfactorily. In this paper,we present new sampling algorithms which can locate the informative columns inpresence of severe data corruptions. In addition, we develop new scalablerandomized designs of the proposed algorithms. The proposed approach issimultaneously robust to sparse corruption and outliers and substantiallyoutperforms the state-of-the-art robust sampling algorithms as demonstrated byexperiments conducted using both real and synthetic data.
机译:当数据严重损坏时,传统的采样技术就无法绘制数据的描述性草图,因为这种损坏会破坏数据令人满意地执行所需的低秩结构。在本文中,我们提出了新的采样算法,该算法可以在严重数据损坏的情况下定位信息列。此外,我们为提出的算法开发了新的可扩展随机化设计。所提出的方法在减少腐败和离群值的同时具有强大的鲁棒性,并且在性能上远远超过了最新的鲁棒性采样算法,这是通过使用真实数据和合成数据进行的实验证明的。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号